package cn.lzd.mr.mroverride.combine;

/**
 * Created by lzd on 2018/6/28.
 */
public class CommonInputFormat {
    //InputFormat 常见的接口实现类包括：

    /**
     * TextInputFormat、 默认的k键是 LongWritable 类型，存储该行在整个文件中的字节偏移量。值是这行的内容
     */

    /**
     * KeyValueTextInputFormat
     * 设置conf.set(KeyValueLineRecordReader.KEY_VALUE_SEPERATOR, "——>")
     * 数据：hello——>world
     * 拿到的数据key=hello ,value = world
     */

    /**
     * NLineInputFormat 按行数N去切割
     * 文件一共52行，N设置10
     * 切割后的split =52/10 = 5+1 = 6
     */

    /**
     * CombineTextInputFormat
     * 合并小文件设置最小最大切割大小
     */

    /**
     * inputformat 自定义
     *（1）自定义一个类继承 FileInputFormat。
     *（2）改写 RecordReader，实现一次读取一个完整文件封装为 KV。
     *（3）在输出时使用 SequenceFileOutPutFormat 输出合并文件。
     */


}
